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双向 分 类 随机 效应 模型 中 方差 分 量 的 估计 * 
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摘 要 : 双向 分 类 随机 效应 模型 是 一 类 有 着 广泛 应 用 背景 的 统计 模型 ， 其 中 对 模型 中 方差 参数 的 一 种 
重要 估计 方法 是 方差 分 析 估 计 。 由 于 方差 分 析 法 得 到 估计 的 均 方 误差 (MSE) 并 不 是 最 小 的 ， 
本 文 在 一 类 新 的 估计 族 中 提出 了 改进 的 ANOVA 估计 。 结 果 表 明 新 的 估计 比 ANOVA 具有 较 小 
的 MSE， 这 种 新 的 估计 方法 可 推广 到 医学 领域 中 常见 的 一 般 模型 。 
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随机 效应 模型 是 广泛 应 用 于 生存 分 析 、 医 学 、 经 济 、 质 量 控制 等 领域 的 一 类 模型 ， 对 模型 
中 方差 参数 估计 的 研究 已 经 很 多 ， 比 如 方差 分 析 估 计 (ANOVA)， 极 大 似 然 估 计 (MLE)， 限 制 
极 大 似 然 估 计 (REMLE)， 最 小 范 数 二 次 无 偏 估计 (MINQUE)、 谱 分 解 估计 (SDE)，Bayes 估 
计 等 。 由 于 ANOVA 估计 具有 显示 表达 式 ， 关 于 它 的 研究 文献 也 比较 多 ， 比 如 文献 [1,2]。 

双向 分 类 随机 效应 模型 是 一 类 重要 的 随机 效应 模型 ， 带 交互 效应 的 双向 分 类 随机 效应 模型 
的 具体 形式 为 


Yijg = +oitB;+yjt+eir i=l, ,0; 了 一] (1) 


这 里 a > 2, b > 2, c > 2, /是 未 知 的 固定 常数 ，ai, 6B;, ij 分 别 表示 固定 效应 ， 随 机 效应 和 交 
又 效应 ，eiik 是 随机 误差 。 假 定 8;, Yij, eiik 为 相互 独立 的 正 态 随机 变量 ， 其 均值 均 为 零 ， 方差 
分 别 为 03, 02， o2, Wi 为 第 (i 力 单 元 上 的 第 大 次 观测 值 。 

模型 (1) 的 矩阵 形式 为 


三 1 十 Xa 二 BT 二 27 二 e， (2) 
其 中 


y= (YY YD) = (Yi i122 Vilecy Wi21 Vi2c 5) Wibce) ， 
Q = (Q1,Q2, , Qa), B= (Bi,B2,:… , Bo), 7 = (11, 712 ;1b) 21) ;Tab)， 


8 下 = .| 9 ee 和 4 
ee 二 (el,€2,° ,en) ) .Ci 一 (ei11, €i12;* ) Eilcy €i21;° °° ,Ci2c,''* ,ibl, , eibc) ， 
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了 = 也 @1lob Ui = 108181. Uz = 1 81. 8 表示 Keonecker 乘 积 ，1m 和 Im 分 别 表 
示 元 素 全 为 1 的 m 维 列 向 量 和 mm 维 单位 矩阵 。 根 据 模型 (1) 的 假定 ， 不 难得 出 8, Y, e 相互 独立 
有 ~ N(0,031), Y~ N(0,0215), e ~ N(0,0214)， 这 里 n= abc。 

对 双向 分 类 随机 效应 模型 (2)， 方 差分 量 o3，o2，02 的 ANOVA 估计 分 别 记 为 534，634 和 
624， 它 们 是 二 次 统计 量 的 线性 组 合 。 范 和 王 问 在 均 方 损失 下 修正 了 ANOVA 估计 ， 得 到 
的 估计 无 妨 记 为 653，652m, 和 62y,， 它 们 仍然 是 二 次 统计 量 的 线性 组 合 。 事 实 上 ， 范 和 
王 回 在 估计 类 {1634 1t > 0}，{t6241t > 0}，{t624 |t > 0} 中 分 别 考 虑 了 在 均 方 损失 下 优 
于 ANOVA 的 估计 。 受 到 Kelly 和 Mathew 轩 关于 在 混合 效应 模型 中 构造 非 负 方 差 参 数 估计 
方法 的 启发 ， 本 文 在 一 类 新 的 估计 族 中 构造 方差 参数 0，o2 的 修正 ANOVA 估计 ， 得 到 的 
估计 分 别 记 为 658,，62Mm,。 在 均 方 损失 意义 下 ，68Mys 和 62M, 分 别 一 致 优 于 范 和 王 回 的 估 
计 63m 和 2%， 以 及 ANOVA 估计 634 和 624。 

为 了 与 范 和 王 问 提出 的 修正 ANOVA 估计 做 比较 ， 本 文 第 2 小 节 关 于 方差 分 量 的 ANOVA 估 
计 都 是 建立 在 范 和 王 站 文章 中 所 研究 的 双向 分 类 随机 效应 模型 上 ， 文 章 第 3 把 结论 推广 到 更 一 
般 的 双向 分 类 随机 效应 模型 。 


2 方差 分 量 ANOVA 估计 的 改进 
为 了 构造 改进 的 ANOVA 估计 ， 首 先 引入 ANOVA 估 计 o3，o2，o2。 定 义 统计 量 


a b ec 
$58 = 2 2 (0s 一 下 


这 1 j=1 k=1 
a b ec 
= 》 》 (+) 
4 
a b cc 
$5e = ,YY (yi — Hi), 
i=1 j=1 k=1 
其 中 
a b < 
二 = Dne 和 BSS Te yD .= >》 >》 >》 Wiik/abc 
了 一 1 k=1 1 一 1 k=1 一 1 二 1 


根据 范 和 王 问 ，SSs，SSy，SS。 可 以 分 别 表示 为 y"H5Hay, y"H7Hyy 和 w" HTHey。 记 zg = 
Hay; zy 二 Hyy 和 Ze 三 Hey, 则 有 
1) 26，2y，2e 相互 独立 ; 
2) 2528 ~ A3X?s 272y ~ 和 X22 ，2Ize MX2X2 ， 这 里 
re=b—1, r=(a—-1)(b—1), r=ab(c—1), 
3 = acos + ca? 十 02, be 三 co2 +0o2, =o2. 
令 55e，S5y，SS。 和 它们 的 数学 期 望 相等 ， 就 得 到 一 组 关于 o3，o2，o2 的 方程 组 ， 解 此 方 
程 组 得 方差 分 量 的 ANOVA 估计 分 别 为 
-22 _ S58 S55y 32 _S5y SSe 32 So2e 


23， 一 一 人 a = 
44 acrg acry” 4 2 
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范 和 王 回 在 估计 类 {t62， 上 > y {t6841t > 0}, {t624 1t > 0} sn 
下 优 于 ANOVA 的 估计 624, 634, 624， 得 到 的 估计 3Mm,，62,，62m, 具有 下 述 结 
在 均 方 误差 意义 下 ，o3 的 估计 


G8Mm, = (re/(rg+ 2))534， 
02 的 估计 
LS = (ry/(ry 十 2))634， 
02 的 估计 
62m, = = (1/(re 十 2))62 Oe4， 
分 别 优 于 ANOVA 估计 634，624 和 624。 

对 oj3 和 sy 的 估计 ， 受 到 Kelly 和 Mathew 国 关于 在 混合 效应 模型 中 构造 非 负 方 差 参 数 估计 
方法 的 启发 ， 本 文 提 出 一 个 新 的 改进 的 ANOVA 估计 ， 这 个 估计 在 均 方 损失 下 一 致 优 于 相应 的 
范 和 王 [ 提出 的 修正 ANOVA 估计 和 ANOVA 估计 。 关 于 03 和 3?， 分 别 考虑 具有 下 述 形式 的 
估计 类 | 


DZ 
Cap = (二 Ee 


| } 
0 <1 1 
Be 7 < mpgpi ， MB82 < 本 


县 
My1 Zr QT ZT 
b= {me 和 
Te 


C \ry 


0<ma <1, ma <1). 


事实 上 ， 在 上 述 估计 类 Lg， Ly 中 ，mgz < 1, ms < 1 使 得 在 这 两 个 估计 类 中 得 到 的 估计 ， 
无 妨 记 为 03wy, 和 62m,， 它 们 取 负 值 的 概率 分 别 小 于 63wy, 和 62M,， 以 及 934 和 624。 

首先 考虑 3 的 估计 ， 研 究 在 估计 类 Ce 中 选择 合适 mpg1, mp2 的 方法 。 实 际 上 ， 本 文通 过 最 
小 化 估计 类 Ce 的 均 方 误差 (MSE) 的 o$ 和 X4 的 系数 得 到 mpl，mpa。 首 先 计 算 MSE(Co)， 简 
单 推导 得 


MSE(£g) = Var(£g) + (E(Lg) 一 oa 


2m2 m2 2 2m2 
B1 2 Bl1 B2 2l\4 
= mm —1 }o8 工 一 mm hh 
{ rg ( B1 ) og 十 (ac)2 rg ry 十 ( 82) 了 
2m 2m 
+ 和 + (mal ~ 1)(1 ~— mp2) ) } 六 03. 


不 难 证 明 ， 最 小 化 cg 的 系数 ， De mp1 最 小 化 X 的 系数 ， 可 得 mel = re/(re 十 
2) 和 mpz = ry/(ry 十 2)。 最 终 得 到 o3 的 估计 为 


mpg1 /2828 2 Zry rg ZB28 ry ZZ 
Wo 人 Wik ) 加 人 本 7ry 十 2 2 和 ) 

为 了 符号 上 的 方便 ， 分 别 用 gi (mgi)，g2(mpi,mp2) 和 giz(mp1, mpz) 表示 MSE(Lg) 中 o， 
总 和 X203 的 系数 。 对 于 估计 yw,， 有 如 下 定理 。 

定理 1 在 均 方 损失 意义 下 ， 估 计 63w, 优 于 估计 634 和 63,。 

证 明 先 证 估计 653 优 于 ANOVA 估计 634。 对 于 ANOVA 估计 ，mpl = 1, mpz = 1。 对 
估计 65M? mpgp1 = 78/(78 + 2), mp2 = Ty/(ry 十 2)。 根据 上 述 分 析 ， 


91(1) > gi(ra/(re + 2)), g2(1,1) > 92(rp/(rp + 2),7y/(ry + 2)). 
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经 过 简单 推导 可 得 gi12(1,1) = 4/(acre) > giz(re/(re 十 2),ry/(ry 十 2))。 故 结论 成 立 。 
接 下 来 说 明 63nz, 优 于 估计 Wy,。 对 估计 63Mm， mei = 7r6/(re 十 2)，mp2 二 1。 对 于 这 两 
个 估计 ，cg 的 系数 g1(mei) 相同 ， 我 们 说 明 


g2(re/(r8 + 2),1) > ga(rp/(r8 + 2),7y/ (ry + 2)), 
g912(7g/(ra + 2),1) = 4/(acre) > 912(rp/(r8 + 2), Tr»y/ (ry + 2)). 


简单 推导 可 得 


72 2 
oar/(rpt om/ +o) = Taam a (+ ra} 


2 
S adj 守 人 本 =} = 9g2(re/(rg + 2),1), 


类 似 推 导 可 得 gia(re/tre 十 2),ry/rr 十 2)) < 9lz(re/tre +2),1). 
关于 o2， 在 估计 类 L;y 中 ，ANOVA 估计 G24 对 应 于 my = 1，mya = 1 的 情况 。 范 和 
王国 的 修正 ANOVA 估计 对 应 于 


my 二 TY/ry 十 2， my2 =1. 


类 似 于 估计 OBM, 中 选择 ma1, Ma2 的 方法 ， 经 过 推导 可 得 my1 三 AC t 2)， Ty2 一 re/(re 市 
2)， 也 就 是 ， 我 们 得 到 新 的 os 估计 为 


Ly ZZy ZS 
a 元 十 2“ re ) 
对 估计 2My,， 有 下 述 定理 。 
定理 2 在 均 方 损失 意义 下 ， 估 计 62w, 优 于 估计 624 和 63wy。 
类 似 定理 1 的 证 明 过 程 ， 不 难得 到 定理 2 的 结论 ， 具 体 细节 就 不 再 累 述 。 


3 ”一 般 双 向 分 类 随机 效应 模型 中 ANOVA 估计 的 改进 


第 1，2 小 节 分 析 了 对 双向 分 类 随机 效应 模型 (2) 的 方差 分 量 的 估计 。 模 型 中 假定 a 为 固定 
效应 ， 在 很 多 情况 下 a 假定 为 随机 效应 ， 也 就 是 假定 a ~ N(c3, 五 ) 且 与 6，7，e 独 立 。 此 时 
如 何 给 出 方差 分 量 的 修正 ANOVA 估计 ， 是 本 节 主 要 讨论 的 问题 。 

在 给 出 改进 的 ANOVA 估计 之 前 ， 先 引入 模型 的 ANOVA 估计 。 定 义 统计 量 


这 里 
b ec 
i.. = >», Yijg/ Lc. 
了 一 1 k=1 
由 文献 [5] $10.2，5.56 可 分 解 为 yr EXTEay =: zza， 且 有 以 下 性 质 : 
1) zp，2Zy，Ze， Za 相互 独立 ; 
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2) ziza ~ XXX ， 这 里 re =a 一 1， 入 =beo2 +oo2 二 co2， 
令 S5。,，5SSgp，SSy，SS。 和 它们 的 数学 期 望 相等 ， 就 得 到 一 组 关于 o2， a3，o3，o2 的 方程 
组 ， 解 此 方程 组 得 方差 分 量 02, o3, o2 和 o2 的 ANOVA 估计 分 别 为 


532 SSa _ 33 2» _S5p S55y ,2 _S5, 3S。 ,2 _ SS 
“4 一 1 bery’ Oo acrg acry’ A Ge OeA = Re 
这 里 re = a 一 1, 78 = 了 一 1, ry = (a 一 1)(b 一 1), re = ab(c 一 1)。 根据 上 述 结论 ， 无 论 模 
型 (2) 中 a 是 随机 效应 还 是 固定 效应 ， 方 差 参 数 o3，o2 和 o2 的 ANOVA 估计 一 样 。 所 以 只 需 
要 给 出 o2 的 修正 ANOVA 估计 。 对 o2， 考 虑 估计 族 


pa (eu (2 Ma SSYy 


bec ra i )| "< ma <1 mos <1}. 


类 似 于 在 估计 族 Lg 或 者 Ly 选择 权重 的 方法 ， 经 过 计算 得 到 mo， = ra/(ra + 2)，mas = 
ry/ (ry 十 2)， 相 应 的 得 到 o2 的 估计 62xr ， 它 具有 如 下 性 质 。 
定理 3 在 均 方 损失 意义 下 ， 估 计 62hr 优 于 ANOVA 估计 524。 


参考 文献 : 


[1] LaMotte L R. On non-negative quadratic unbiased estimation of variance components{J]. Journal of the 
American Statistical Association, 1973, 68: 728-730 

[2] Mathew T, Sinha B K, Sutradhar B C. Nonnegative estimation of variance components in unbalanced 
mixed models with two components{J}. Journal of Mnultivariate Analysis, 1992, 42; 77-101 

[3] 范 永 辉 ， 王 松 桂 . 两 向 分 类 随机 效应 模型 中 方差 分 量 的 非 负 估 计 [ 四 . 工程 数学 学 报 ，2007, 24(2): 303-310 

[4] Kelly R J, Mathew T. Improved nonnegative estimation of variance components in some mixed modles 
with unbalanced data[J]. Technometrics, 1994, 36: 171-181 

[5] Wang S G, Chow S C. Advanced Linear Models: Theory and Applications[M]. New York: Marcel Dekker 
Inc, 1994 


New Estimation of Variance Components in Two-way Classification 
Model with Random Effects 


XU Wang-li 
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Abstract: That two-way classification model with random effects is used widely in practice, one of the 
most important estimation methods for this model is analysis of variance estimate (ANOVA). Notice 
that the mean square error (MSE) of the ANOVA is not the smallest, we propose an improved ANOVA 
based on new estimation family and prove that the MSE of the new estimator is smaller than that of 
ANOVA. The estimation method is extended to general models, which are used mainly in the field of 
medicine. 

Keywords: two way classification model with random effects; ANVOA estimator; MSE 


